ProjectAnalisismDataSederhana.ipynb
No Headings
The table of contents shows headings in notebooks and supported files.
- File
- Edit
- View
- Run
- Kernel
- Settings
- Help
Kernel status: Idle
#Project Data Siswa
Sampel 1000 data Siswa, beragam memiliki 10 kolom
Usia:18-70 : Pendapatan:loc,scale : Skor pembelajaan:1,100 : Lama bekerja:0,20 : Jumlah pembelian:lam=3 : Jumlah keluhan:n=5,p=0.1 : Jenis
kelamin:Pria,wanita,lainnya : Kategori kota: Kota besar,pinggiran,Desa : Level keanggotaan:Perunggu,perak,emas,plantinum : Berlangganan newsletter: 0,1
#Project Data Siswa Sampel 1000 data Siswa, beragam memiliki 10 kolom
Usia:18-70 : Pendapatan:loc,scale : Skor pembelajaan:1,100 : Lama bekerja:0,20 : Jumlah pembelian:lam=3 : Jumlah keluhan:n=5,p=0.1 : Jenis kelamin:Pria,wanita,lainnya : Kategori kota: Kota besar,pinggiran,Desa : Level keanggotaan:Perunggu,perak,emas,plantinum : Berlangganan newsletter: 0,1
[34]:
import pandas as pd
import numpy as np
def buat_data_sampel(jumlah_baris=1000):
np.random.seed(42)
# Fitur numerik kontinu
usia = np.random.randint(18, 70, size=jumlah_baris)
pendapatan = np.random.normal(loc=50000, scale=15000, size=jumlah_baris).astype(int)
skor_pembelanjaan = np.random.uniform(1, 100, size=jumlah_baris)
lama_bekerja = np.random.randint(0, 20, size=jumlah_baris)
#Fitur numerik diskret
jumlah_pembelian = np.random.poisson(lam=3, size=jumlah_baris)
jumlah_keluhan = np.random.binomial(n=5, p=0.1, size=jumlah_baris)
#Fitur kategorikal
jenis_kelamin = np.random.choice(['Pria', 'Wanita', 'Lainnya'], size=jumlah_baris, p=[0.48, 0.48, 0.04])
kategori_kota = np.random.choice(['Kota Besar', 'Pinggiran', 'Desa'], size=jumlah_baris, p=[0.5, 0.3, 0.2])
level_keanggotaan = np.random.choice(['Perunggu', 'Perak', 'Emas', 'Plantinum'], size=jumlah_baris, p=[0.4, 0.3, 0.2, 0.1])
#Fitur biner
berlangganan_newsletter = np.random.choice([0, 1], size=jumlah_baris, p=[0.6, 0.4])
#Variabel target - klasifikasi biner
target = ((skor_pembelanjaan > 75) & (jumlah_pembelian > 2)).astype(int)
df = pd.DataFrame({
'Usia': usia,
'Pendapatan': pendapatan,
'SkorPembelajaan': skor_pembelanjaan,
'LamaBekerja': lama_bekerja,
'JumlahPembelian': jumlah_pembelian,
'JumlahKeluhan': jumlah_keluhan,
'JenisKelamin': jenis_kelamin,
'KategoriKota': kategori_kota,
Pratinjau data sampel:
Usia Pendapatan SkorPembelajaan LamaBekerja JumlahPembelian \
0 56 25903 99.637099 14 5
1 69 53051 37.462644 3 3
2 46 38654 45.412452 11 6
3 32 28666 72.485023 5 2
4 60 40301 88.733382 18 4
JumlahKeluhan JenisKelamin KategoriKota LevelKeanggotaan \
0 0 Wanita Pinggiran Perunggu
1 1 Wanita Desa Perunggu
2 1 Wanita Pinggiran Perunggu
3 0 Wanita Desa Emas
4 0 Wanita Desa Perunggu
BerlanggananNewsletter Target
0 0 1
1 1 0
2 0 0
3 0 0
4 0 1
Nama kolom dalam DataFrame:
['Usia', 'Pendapatan', 'SkorPembelajaan', 'LamaBekerja', 'JumlahPembelian', 'JumlahKeluhan', 'JenisKelamin', 'KategoriKota', 'LevelKeanggotaan', 'BerlanggananNewsletter', 'Target']
=== Ringkasan Statistik Sedehana ===
Ringkasan Kolom Numerik:
Usia Pendapatan SkorPembelajaan LamaBekerja \
count 1000.00000 1000.000000 1000.000000 1000.000000
mean 43.81900 50863.121000 50.089569 9.873000
std 14.99103 14823.257362 28.659070 5.752387
min 18.00000 6556.000000 1.001152 0.000000
25% 31.00000 40822.250000 26.673211 5.000000
50% 44.00000 50807.000000 49.827353 10.000000
75% 56.00000 60281.750000 75.436941 15.000000
max 69.00000 89485.000000 99.836404 19.000000
JumlahPembelian JumlahKeluhan BerlanggananNewsletter Target
count 1000.00000 1000.000000 1000.000000 1000.000000
mean 2.95800 0.516000 0.415000 0.145000
std 1.73414 0.691536 0.492969 0.352277
min 0.00000 0.000000 0.000000 0.000000
25% 2.00000 0.000000 0.000000 0.000000
50% 3.00000 0.000000 0.000000 0.000000
75% 4.00000 1.000000 1.000000 0.000000
max 10.00000 4.000000 1.000000 1.000000
Ringkasan Kolom Kategorikal:
Kolom: JenisKelamin
JenisKelamin
Wanita 483
Pria 483
Lainnya 34
Name: count, dtype: int64
JenisKelamin
Wanita 0.483
Pria 0.483
Lainnya 0.034
Name: proportion, dtype: float64
Kolom: KategoriKota
KategoriKota
Kota Besar 501
Pinggiran 304
Desa 195
Name: count, dtype: int64
KategoriKota
Kota Besar 0.501
Pinggiran 0.304
Desa 0.195
Name: proportion, dtype: float64
Kolom: LevelKeanggotaan
LevelKeanggotaan
Perunggu 414
Perak 293
Emas 198
Plantinum 95
Name: count, dtype: int64
LevelKeanggotaan
Perunggu 0.414
Perak 0.293
Emas 0.198
Plantinum 0.095
Name: proportion, dtype: float64
Kolom: BerlanggananNewsletter
BerlanggananNewsletter
0 585
1 415
Name: count, dtype: int64
BerlanggananNewsletter
0 0.585
1 0.415
Name: proportion, dtype: float64
Kolom: Target
Target
0 855
1 145
Name: count, dtype: int64
Target
0 0.855
1 0.145
Name: proportion, dtype: float64
[ ]:
Common Tools
No metadata.
Advanced Tools
No metadata.
Anaconda Assistant
AI-powered coding, insights and debugging in your notebooks.
To enable the following extensions, create an account or sign in.
- Anaconda Assistant4.1.0
- Coming soon!
- Data Catalogs
- Panel Deployments
- Sharing
Already have an account? Sign In
For more information, read our Anaconda Assistant documentation.
![Python [conda env:anaconda3]](./ProjectAnalisismDataSederhana_files/logo-64x64.png)